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基于 深度 卷 积 生成 式 对 抗 网 络 的 菌 草 两 二 醛 含量 可 见 / 
近 红 外 光谱 反 演 
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350002, 中 国 ; 3. 福建 农林 大 学 园艺 学 院 ,福建 福州 350002, 中 国 ) 


摘 要 : [目的 /意义 ] 菌 草 是 多 年 生 可 用 作 饲 料 与 生物 质 能 源 的 草本 植物 ， 在 温带 种 植 需 克服 越冬 问题 。 低 温 胁 
迫 会 对 菌 草 的 生长 发 育 造成 不 利 影响 。 丙 二 醛 (Malondialdehyde，MDA) 含量 作为 诊断 菌 草 低温 胁迫 状态 的 有 力 
诊断 指标 ， 利 用 光谱 技术 反 演 MDA 含量 ， 可 快速 无 损 地 评估 菌 草 生长 动态 ， 为 菌 草 育 种 及 低温 胁迫 诊断 提供 参 
考 。[ 方 法 ] 本 研究 基于 6 个 品种 的 菌 草 植株 ,设置 低温 胁迫 组 与 常温 对 照 组 ， 获 取 菌 草 苗 期 的 可 见 / 近 红 外 光谱 
( Visible/Near Infrared Spectrum, VIS/NIR) 数据 与 叶片 MDA 含量 信息 ,分 析 低 温 胁 迫 条 件 下 菌 草 MDA 含量 及 其 光 
谱 反 射 率 均 相 应 增加 的 变化 趋势 ; 为 提升 模型 的 检测 效果 ,提出 了 改进 的 一 维 深度 卷 积 生成 式 对 抗 网 络 (Deep 
Convolutional Generative Adversarial Networks, DCGAN) 用 于 样本 数量 增 广 ， 并 建立 基于 随机 森林 (Random Forest, 
RF), 、 偏 最 小 二 乘 回 归 (Partial Least Squares Regression, PLSR) 以 及 卷 积 神经 网 络 (Convolutional Neural Net- 
works, CNN) 算法 的 MDA 光谱 定量 检测 模型 。[ 结 果 和 讨论 ] DCGAN 可 优化 模型 的 可 靠 性 与 MDA 检测 精度 ， 
DCGAN 联合 RF 模型 可 以 得 到 最 佳 的 检测 效果 ， 其 中 预测 集 决定 系数 RR 为 0.7922， 均 方 根 误差 为 2.4063， 残 差 预 
测 偏 差 (Residual Predictive Deviation, RPD) 为 2.1937。[ 绪 论 ] 本 研究 利用 DCGAN 进行 样本 数量 增 广 ， 能 显著 
提升 基于 光谱 数据 的 模型 对 菌 草 MDA 含量 的 反 演 精度 与 预测 性 能 。 
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1 引 &8 自然 灾害 ， 尤 其 对 农业 生产 具有 不 利 影响 9. x 
— E 
BETERA R HH MEL CA BT is a 
由 于 其 具有 生物 量 大 、 营 养 成 分 高 等 特点 , 在 饲 A l ae LI, 
料 、 生 物质 能 源 与 材料 开发 等 领域 都 具有 巨大 的 应 抗 性 品种 的 筛选 具有 重要 意义 。 
用 价值 。 目 前 ， 中 国 菌 草 种 植 技术 已 推广 到 世界 范 植物 在 遭遇 低温 肪 迫 时 ， 会 因 脂 质 过 氧化 反应 
于 内 众多 国家 和 地 区 ， 对 于 促进 全 球 经 济 共同 发 展 。 导致 蛋白 质 裂 解 和 细胞 膜 系 统 的 破坏 ， 从 而 损害 其 
具有 重要 意义 " 轨 。 低 温 胁迫 下 的 冷害 是 全 球 性 的 ”光合 作用 与 呼吸 作用 ， 重 则 导致 植物 死亡 7. A 
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—HBE (Malondialdehyde, MDA) 是 多 不 饱和 脂肪 
酸 过 氧化 物 的 降解 产物 。 植 物 遭 遇 低 温 逆境 的 损伤 
越 严 重 ， 其 MDA 含 量 就 越 高 "”。 因 此 ，MDA 含 
量 可 作为 研究 植物 生长 动态 的 有 力 诊 断 指标 。 准 确 
预测 植物 体内 MDA 含量 可 实时 反映 植物 的 健康 状 
Ui. Witt EL EER (Thiobarbituric Acid Method, 
TBA) 法 是 测定 植物 中 MDA 最 和 常用 的 方法 之 
一 ,但 其 耗 时 耗 力 ， 且 具有 破坏 性 ， 难 以 对 大 
尺度 的 田间 作物 进行 实时 有 效 的 检测 中。 因此 建 
立 一 种 快速 、 无 损 、 有 效 的 MDA 测定 方法 对 植物 
胁迫 监测 具有 重要 意义 。 

近年 来 ， 随 着 各 类 光学 传 感 咒 及 机 器 学 习 技 术 
的 发 展 ， 可 见 / 近 红 外 光谱 技术 由 于 其 快速 、 无 损 
等 众多 优势 已 被 广泛 地 应 用 在 农业 "“”“”、 食 品 “、 
医药 “等 领域 。 在 以 往生 化 指标 测定 的 研究 中 ， 
大 多 采用 光谱 预 处 理 以 及 优化 建 模 的 方式 来 提高 模 
型 的 准确 性 。Phuphaphud 等 ”以 甘蔗 为 研究 对 象 ， 
利用 可 见 / 近 红外 光谱 结合 预 处 理 方法 对 其 不 同 部 
位 进行 纤维 含量 预测 ， 基 于 偏 最 小 二 乘 回 归 (Par- 
tial Least Squares Regression, PLSR) 模型 ， 其 最 佳 
的 模型 检测 性 能 民 ?为 0.81。Chanda 等 ^" 以 茶叶 为 
研究 对 象 ， 利 用 近 红 外 光谱 对 咖啡 因 含量 进行 检 
iu, ， 根 据 咖啡 因 中 不 同化 学 键 的 响应 特征 获取 有 效 
波长 ， 结 合 预 处 理 技术 与 两 种 回归 模型 ， 包 括 支 持 
向 量 机 (Support Vector Regression, SVR) 和 
PLSR， 其 中 最 佳 的 尺 ? 为 0.637。 张 亚 坤 等 P" 基于 
近 红 外 光谱 测定 大 豆 叶 片 可 溶性 蛋白 含量 ， 表 明 
Savitzky-Golay 平 滑 结合 连续 投影 算法 (Successive 
Projections Algorithm, SPA) 可 获得 最 佳 的 检测 效 
果 ， 其 中 预测 集 尼 为 0.746。 上 述 研究 虽 都 取得 了 
较 好 的 效果 ， 然 而 在 实际 样本 采集 中 ， 获 取 大 量 数 
据 的 难度 较 大 ， 而 数据 量 较 小 的 情况 往往 又 会 影响 
建 模 精度 ， 因 此 扩充 高 质量 的 样本 数据 集 很 有 
必要 0228), 

Radford 等 "1 于 2015 年 提出 了 深度 卷 积 生成 式 
对 抗 网 络 (Deep Convolutional Generative Adversari- 
al Networks, DCGAN) 用 于 生成 高 质量 图 像 ， 在 
数据 增强 、 图 像 修复 、 超 分 辨 率 重 构 等 领域 均 取 得 
了 很 好 的 效果 '“”。 基 于 此 ， 为 探究 利用 DCGAN 
网 络 联合 可 见 / 近 红 外 光谱 反 演 低温 胁迫 下 菌 草 


MDA 含量 的 可 行 性 ， 本 研究 以 6 种 菌 草 为 研究 对 
象 ， 测 定 菌 草 叶片 的 可 见 / 近 红外 反射 率 与 MDA 合 
Ht, 采用 一 维 DCGAN 进行 数据 集 扩充 ， 并 建立 3 
种 定量 检测 模型 ， 包 括 一 维 卷 积 神经 网 络 (Convo- 
lutional Neural Networks，CNN) 、 随 机 森林 (了 Ran- 
dom Forest, RF) 以 及 偏 最 小 二 乘 回 归 (Partial 
Least Squares Regression, PLSR), ， 实 现 菌 草 MDA 
含量 快速 无 损 检测 。 


2 ”材料 与 方法 


2.1 实验 材料 


本 研究 于 2022 年 10-11 月 与 2023 年 3 一 4 月 
在 福建 农林 大 学 菌 草 温室 大 棚 (26°5'21"N, 
119°14'49"E) 进行 。 本 研究 对 象 包含 6 种 典型 的 菌 
草 品 种 ， 分 别 是 绿洲 二 号 Arundo donax cv. Lv 
zhou. No.2, A. donax. No.2), M-E (Arundo 
donax cv. Lv zhou. No.7, A. donax. No.7), E W = 


(Cenchrus fungigraminus) , $& *& (Pennisetum pur- 
pureum Schum) , RZ Æ (Pennisetum purpureum 
Schumab) VIRETA (Pennisetum sinese Roxb) , 
均 由 福建 农林 大 学 国家 菌 草 工程 技术 人 研究 中 心 提 
供 。 样 本 植株 种 植 采用 土 培 方式 ， 将 菌 草 种 节 种 
植 在 穴 盘 中 ( 穴 盘 上 口径 58 mm， 下 口径 20 mm, 
深度 110 mm) ， 并 放置 于 恒温 培养 箱 中 ， 温 度 设 定 
为 28°*C， 定 期 浇 水 。 当 植株 高 度 为 25 cm 左右 时 ， 
将 每 个 品种 的 植株 均匀 分 为 两 组 ， 其 中 对 照 组 继续 
放置 于 28°C 恒 温 培养 箱 中 ， 胁 迫 组 放置 于 4°C 培 养 
箱 中 进行 胁迫 处 理光。 经 过 5d 后 ， 一 次 性 采集 对 
照 组 与 胁迫 组 植株 叶片 作为 实验 样本 ， 并 测定 叶片 
光谱 反射 率 和 MDA 含 量 。 样 本 总 计 144 株 ， 不同 
菌 草 品种 的 植株 如 图 1 所 示 。 


2.2 测定 项 目 及 方法 


2.2.1 叶片 光谱 反射 率 获 取 

使 用 手持 式 地 物 光 谱 仪 (ASD HandHeld 2, 
波长 范围 为 325~ 
1075 nm， 光 谱 分 辩 率 为 1 om) 与 近 红 外 光谱 仪 
(SW2520-050-NIRA， 人 台湾 超 微 光 学 ， 波 长 范围 为 
900—1700 nm， 光 谱 分 辨 率 为 9nm) 采集 远离 主 脉 
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图 1 不 同 品种 的 菌 草 植株 
Fig. 1 Different varieties of JUNCAO plants 


的 菌 草 叶片 在 325~1700 nm 范围 内 的 光谱 信息 ， 每 
个 样本 重复 采集 3 个 不 同位 置 ， 取 其 平均 值 作 为 该 
样本 的 光谱 反射 率 。 数 据 采 集 前 先 开启 装置 预 热 约 
30 min 并 进行 黑白 板 校准 。 由 于 采集 的 光谱 数据 在 
首尾 两 端 会 产生 明显 噪声 ， 为 消除 该 影响 ， 截 取 手 
持 式 地 物 光 谱 仪 采集 的 400—999 nm 范围 内 光谱 
( 共 600 个 波长 参数 ) ， 以 及 截取 近 红 外 光谱 仪 采集 
的 1000—1650 nm 范围 内 的 光谱 ( 共 99 个 波长 参 
WO. ， 经 光谱 拼接 后 ( 共 699 个 波长 参数 ) 用 于 后 
续 实 验 分 析 。 
222 丙 二 醋 含量 测定 
菌 草 叶 片 MDA 含量 的 测定 方法 采用 硫 代 巴 比 
受 酸 法 。 在 样本 完成 光谱 数据 采集 后 ， 剪 下 叶片 ， 
在 剪 叶 时 注意 避 开 叶脉 。 将 每 株 剪 下 的 叶片 混合 后 
称 取 0.1 g 放 置 于 离心 管 中 ， 并 立刻 将 其 用 液 氮 速 
冻 后 放 入 -80°C 冰 箱 中 以 便 后 续 实 验 测 定 。MDA 
含量 具体 测定 方法 如 下 : 将 叶片 加 入 1 mL 提取 液 
后 进行 冰 浴 匀 浆 ， 之 后 在 4°C 下 以 8000 r/min 离心 
10 min, 提取 0.1 mL 上 清 液 并 加 入 0.4 mL TBA 
溶液 后 于 100°C 水 浴 60 min， 然 后 在 25°C 下 以 
10,000 r/min 离心 10 min， 最 后 取 0.2 mL 上 清 液 分 
别 测定 其 在 532 与 600 nm 处 的 吸光 度 用 于 确定 该 样 
ARH) MDA YR IE 
2.3 建 模 方法 与 模型 评价 标准 

深度 卷 积 生 成 式 对 抗 网 络 
本 研究 中 DCGAN 模型 使 用 Python3.8 编程 实 


现 。 实 验 平台 为 Pycharm 社区 版 与 Pytorch2.0.0。 
该 模型 主要 由 生成 需 与 判别 需 构 成 ， 执 行 流程 如 


2.3.1 


图 2 (a) Pray. Ais VA — tod 8 ER BEL LR 
z 作 为 输入 ， 通 过 生成 器 生成 伪 数 据 G (z); 判别 
器 则 以 真实 数据 与 伪 数据 共同 作为 输入 ， 判 别 结 
作为 输出 。 当 训练 完成 时 ， 保 存 生成 样本 完成 数据 
扩充 。 

由 于 该 对 抗 网 络 模型 主要 用 于 图 像 领 域 ， 为 此 
本 研究 在 此 网 络 的 基础 上 进行 了 改进 ， 使 其 适用 于 
一 维 光 谱 数 据 ， 同 时 在 实际 训练 中 ， 为 避免 判别 需 
过 强 导 致 其 出 现 梯 度 消 失 的 现象 ， 从 而 难以 学 习 到 
原始 样本 中 信息 的 问题 ， 本 实验 在 原始 网 络 模型 基 
础 上 减少 了 判别 器 的 网 络 深度 ， 模 型 的 结构 与 参数 
如 图 2 (b) 所 示 。 生 成 器 由 5 个 转 置 卷 积 、5 个 激 
活 函 数 以 及 4 个 批 规范 化 层 组 成 ， 其 中 第 5 层 是 
tanh 激活 函数 ， 其 余 为 ReLU 激活 函数 ， 最 终生 成 
长 度 为 700 的 一 维 向 量 ， 其 中 第 1 列 向 量 为 拟 合 的 
MDA 含 量 信息 ， 后 699 列 为 光谱 参数 ; 判别 器 包含 
4 个 卷 积 层 、2 个 批 规范 化 层 以 及 3 个 LeakyReLU 激 
活 函 数 ， 最 后 通过 sigmoid 激 活 函 数 判别 数据 的 真 
伪 。 该 模型 采用 Adam 优 化 器 ， 生 成 器 与 判别 需 的 
学 习 率 都 设 定 为 0.0002， 批 次 大 小 设 定 为 1， 训 练 
次 数 设 定 为 300。 由 于 模型 训练 前 期 不 够 稳定 ， 
此 仅 保 存 模型 训练 100 次 后 生成 需 最 低 损 失 函 数值 
的 样本 。 

2.3.2 ”模型 建立 

首先 利用 Kennard-stone (KS) 算法 按照 2: 1 
比例 将 原始 样本 划分 为 建 模 集 和 预测 集 ， 其 中 建 模 
集 96 个 ， 预 测 集 48 个 。 其 次 将 96 个 建 模 集 样本 通 
过 DCGAN 模 型 生成 4 倍 于 建 模 集 的 伪 样本 ， 共 384 
个 。 最 后 将 伪 样 本 随机 打 乱 并 依次 加 入 到 建 模 集 
中 ， 构 成 增强 建 模 集 ， 利 用 不 同 回归 建 模 方法 以 及 
添加 的 生成 样本 数量 进行 模型 评价 。 

本 研究 构建 PLSR、RF 以 及 CNN E JH TF TR] 
草 低温 胁迫 MDA 和 定量 检测 ， 其 中 CNN 模 型 具体 网 
络 参数 如 表 1 所 示 。 模 型 超 参 数 设 定 : 优化 器 选择 
随机 梯度 下 降 (Stochastic Gradient Descent, 
SGD); 批 大 小 为 48; 迭代 次 数 设 定 为 500 次 ,为 
防止 过 拟 合 ， 会 提前 停止 训练 ;学 习 率 为 0.001。 
2.9.8 评价 指标 
选用 决定 系数 (Coefficient of Determination, 

均 方 根 误差 (Root Mean Square Error, 


R); 
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‘Px 256 175 | 
x 小 1X 512x 88 | 
2 dxmexil | 
Hh 0m mE vo ABA. 
生成 器 判别 器 
(b)DCGAN 网 络 参数 
图 2 DCGAN 流程 及 其 具体 网 络 参数 
Fig. 2 Flowchart of DCGAN and its specific network parameters 
1 CNN 网 络 参 类 Lo 
表 1 CNN 网络 参数 3 ”结果 与 讨论 
Table 1 CNN network parameter 
网 络 层 。 卷 积 核 大 小 卷 积 核 数量 Padding 激活 函数 3.1 低温 胁迫 对 菌 草 叶片 光谱 反射 率 与 MDA 
Convl 3 16 ReLU NE 
ony same e 含量 的 EA 响 
Conv2 3 32 same ReLU 


RMSE) 与 残 差 预测 偏差 (Residual Predictive Devi- 
ation, RPD) 对 模型 的 预测 性 能 进行 评估 。 一 般 情 
况 下 ，R’ 与 RPD 越 大 ，RMSE 越 小 ， 表 明 该 模型 预 
测 值 与 实测 值 相关 性 好 ， 且 预测 性 能 也 越 好 。 具 体 
计算 方法 如 公式 (1) ~ (3) 所 示 。 


ay (1) 


(2) 


RPD = —— = (3) 


其 中 ，y, ,。、y, ,分 别 为 第 i 个 样本 的 实际 测量 
MDA 含量 值 和 模型 预测 的 MDA 含量 值 ，nmol/g; 
7。、 ,分 别 为 样本 实际 测量 平均 值 和 模型 预测 平 
均值 ，nmol/g; SD,、SEP 分 别 为 预测 集 的 实际 含量 
标准 偏差 和 预测 标准 偏差 nmol/g; 7 为 样本 的 数 


=. 
E, 


o 


图 3 为 常温 (28°C) 对 照 组 与 低温 (4°C) 胁 
迫 组 培养 5d 后 ，6 个 品种 菌 草 的 平均 光谱 以 及 对 应 
AY MDA 含量 图 。 其 中 在 波长 1000 nm 范围 附近 光 
谱 反 射 率 有 着 明显 的 偏 移 ， 这 主要 是 由 两 台 仪器 
不 同 的 设备 参数 导致 的 。 在 可 见 光 范围 内 (400— 
740 nm)， 在 550 nm 附近 处 有 明显 的 强 反射 峰 ， 主 
要 由 于 绿色 植物 叶片 对 绿 光 吸收 少 ; 在 可 见 光 波长 
480 和 675 nm 附近 出 现 了 深 吸 收 的 波 谷 ， 主 要 由 于 
绿色 植物 内 叶绿素 强 吸 收 引 起 的 ， 而 在 近 红 外 范围 
内 (740—1650 nm) 的 光谱 曲线 则 主要 受到 叶片 内 
部 结构 以 及 水 分 含量 的 影响 *。 

此 外 ， 由 图 3 对 比分 析 可 知 ， 低 温 胁迫 组 与 对 
照 组 的 菌 草 植株 表现 出 不 同 的 光谱 特征 ， 但 总 体 趋 
势 一 致 。 在 全 波段 范围 内 ， 胁 迫 后 的 菌 草 叶片 相 较 
于 对 照 组 来 说 ， 光 谱 反 射 率 都 产生 了 明显 的 上 移 ， 
原因 为 在 可 见 光 范围 内 ， 光 谱 反 射 率 主要 受 色 素 的 
影响 ， 而 低温 胁迫 会 破坏 原 有 的 色素 ， 造 成 反射 率 
升 高 的 情况 ， 而 在 近 红 外 范围 内 ， 低 温 胁迫 会 造成 
植物 叶片 组 织 结构 发 生 一 定 的 损伤 ， 同 时 也 会 导致 
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叶片 含水 量 的 降低 ， 这 会 造成 光谱 反射 率 变 高 的 情 。 同 菌 草 品种 得 到 了 不 同 浓度 梯度 的 MDA 含量 ， 数 

况 。 这 一 趋势 也 与 一 些 学 者 的 研究 结果 一 致 ””。 据 分 布 均 匀 人 合理， 并 且 各 品种 兰草 的 MDA 含 量 在 
在 遭遇 低温 胁迫 后 ， 各 品种 菌 草 的 MDA 含 量 ”对照 组 与 胁迫 组 当中 均 表 现 出 显著 性 差异 (P< 

相 较 于 对 照 组 都 具有 一 定 的 提高 ， 表 现 出 脂 质 过 氧 ”0.05)， 有 利于 后 续 建 立 稳定 的 定量 模型 。 

化 现象 ， 说 明 植 株 受 到 损伤 。 同 时 ， 本 研究 利用 不 
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注 :ab 代 表 Duncan 检 测 下 低温 胁迫 的 MDA 含 量具 有 显著 差异 (P<0.05) 
图 3 菌 草 叶片 的 平均 光谱 与 MDA 含量 图 
Fig.3 Average spectra and MDA content of JUNCAO leaves 


3.2 利用 深度 卷 积 生成 式 对 抗 网 络 扩充 菌 草 红外 光谱 反射 信息 ; 图 4 (b) 为 经 DCGAN 模 型 生 
原始 光谱 及 MDA 含 量 信息 成 的 伪 样 本 ， 样 本 数 为 384 个 。 可 以 看 出 生成 样本 

的 光谱 曲线 保留 了 原始 光谱 曲线 的 形状 和 变化 趋 

势 ， 但 与 原始 光谱 曲线 并 不 完全 一 致 ， 原 因 是 在 


图 4 (a) 为 144 个 菌 草 叶片 样本 的 原始 可 见 / 近 
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DCGAN 模 型 中 引入 了 高 斯 噪声 ， 增 加 了 样本 的 多 
样 性 。 对 比分 析 图 4 可 知 ， 生 成 样本 的 反射 区 间 比 
原始 样本 小 ， 可 能 是 因为 原始 样本 中 大 部 分 样本 的 
光谱 反射 值 相对 集中 ， 导 致 生成 器 产生 在 其 他 位 置 
的 反射 值 容易 被 判别 器 鉴定 为 假 样本 。 
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图 4 菌 草 叶片 的 原始 样本 与 生成 样本 光谱 图 
Fig.4 Original spectra and generated spectra of 
JUNCAO leaves 

对 比 原始 样本 与 生成 样本 的 MDA 含量 统计 
特征 ， 如 表 2 所 示 。 生 成 样本 中 MDA 含量 的 最 
小 值 与 最 大 值 均 在 原始 样本 的 范围 内 ,分 别 为 
13.2523 与 34.5608 nmolg， 并 且 平 均值 与 标准 差分 
别 只 下 降 0.6650 与 0.9743 nmolg。 结 果 表 明生 成 的 
MDA 含 量 值 能 很 好 地 符合 原始 样本 的 分 布 。 

表 2 MDA 含 量 统计 特征 
Table 2 Statistical characteristics of MDA content 


最 小 值 / ”最 大 值 / ”平均 值 / 标准 差 / 
样本 类 型 ”数量 a E a a 
(nmobg?) (nmolg ) (nmolg ) (nmol-g™) 
原始 样本 144 — 12.1988 36.7918 21.5571 5.8438 
生成 样本 384 13.2523 34.5608 20.8921 4.8695 


由 于 在 原始 样本 中 ， 各 品种 菌 草 叶片 的 MDA 
含量 在 对 照 组 与 胁迫 组 当中 均 存 在 显著 差异 性 (P< 


0.05) ， 胁 迫 组 的 叶片 MDA 含量 往往 高 于 对 照 组 。 


将 原始 样本 中 对 照 组 与 胁迫 组 的 MDA 含量 分 别 建 
立 概 率 密度 曲线 ， 如 图 5 (a) 所 示 。 可 以 看 出 对 照 
组 在 MDA 含 量 为 17.0014 nmol/g 时 ， 其 概率 密度 取 
得 最 高 值 ， 胁 迫 组 在 MDA 含量 为 25.5955 nmol/g 
时 ， 其 概率 密度 取得 最 高 值 ， 并 且 在 MDA 含 量 为 
20.9407 nmol/g 时， 两 者 概率 密度 值 相同 。 因 此 ， 
将 临界 值 20.9407 nmolg 作为 生成 样本 中 对 照 组 与 
胁迫 组 的 划分 依据 ， 将 MDA 含量 小 于 该 值 的 样本 
作为 对 照 组 ，MDA 含量 大 于 该 值 的 样本 作为 胁迫 
组 ， 比 较 生 成 样本 在 可 见 / 近 红 外 光谱 的 差异 性 。 
图 5 (b) 为 生成 样本 中 对 照 组 与 胁迫 组 的 平均 光谱 
曲线 ， 可 以 看 出 ， 胁 迫 组 的 平均 光谱 在 大 部 分 波长 
范围 内 都 高 于 对 照 组 ， 虽 然 仅 在 530、1000~1300 
以 及 1450 nm 处 较为 显著 ， 但 仍 较 好 地 满足 了 原始 
样本 的 光谱 特征 。 

上 述 结 果 说 明 ， 经 DCGAN 模 型 生成 的 样本 在 
自身 具有 多 样 性 的 同时 ， 与 原始 样本 也 具有 较 高 的 
相似 性 。 因 此 ， 生 成 样本 符合 原始 样本 的 分 布 规 
律 ， 可 对 原始 样本 进行 数据 扩充 。 
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(b) 生 成 样本 的 平均 光谱 曲线 
图 5 菌 草 叶片 原始 样本 的 概率 密度 与 生成 样本 的 平均 光谱 曲线 
Fig. 5 Probability density of the original samples and the corre- 
sponding average spectral curves of the generated samples of 


JUNCAO leaves 
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3.3 基于 原始 样本 与 生成 样本 构建 菌 草 MDA 
含量 检测 模型 


在 构建 检测 模型 之 前 ， 先 将 生成 样本 随机 打 
乱 ， 并 依次 添加 到 原始 建 模 集 中 。 分 别 采用 PLSR.、 
RF 以 及 CNN 构 建 定量 检测 模型 来 对 DCGAN 生成 
的 数据 在 同一 预测 集 上 进行 评估 。 由 于 CNN 模型 
训练 时 间 较 长 ， 无 法 将 生成 样本 依次 加 入 到 建 模 集 
中 ， 因 此 本 研究 在 构建 CNN 回归 模型 中 按 比例 在 
建 模 集中 加 入 48、96、192、288、384 个 生成 
样本 。 

三 种 模型 的 检测 结果 如 图 6 所 示 。 在 未 添加 生 
成 样本 时 ,不同 模 型 在 预测 集 上 的 RR 差异 显著 ,其 
中 RF 模型 的 RR 为 0.6967，RMSEP 为 2.7591; CNN 
模型 的 RR 为 0.6729，RMSEP 为 3.1353; 而 PLSR 模 
型 的 RR 仅 为 0.5298，RMSEP 为 3.6646。 随 后 在 建 模 
集中 逐步 添加 生成 样本 ， 可 以 看 出 ， 在 加 入 生成 样 
本 后 ，3 种 模型 的 RR 在 预测 集 上 丝 表 现 出 先 增 大 后 
减 小 的 趋势 ，RMSEP 则 先 减 小 后 增 大 。 表 3 为 3 种 
模型 的 最 优 训 练 结 果 ， 相 较 于 未 添加 生成 样本 的 预 
DUE BER/, CNN 模型 最 高 提升 11.2%; RF 模型 最 
高 提升 13.7%; PLSR 最 高 提升 42.8%， 且 RF 模型 
可 以 得 到 最 佳 的 检测 效果 。Zhang 等 ^U 利用 近 红 外 
光谱 对 松树 叶片 的 MDA 含 量 进行 估 测 ， 通 过 将 光 
谱 预 处 理 与 重要 特征 选择 算法 应 用 于 PLSR， 其 最 
佳 的 尼 为 0.66， 但 原始 尼 为 0.64， 二 者 差距 不 大 。 
本 研究 将 原始 样本 进行 数据 扩 增 后 建立 3 种 回归 模 
型 ， 其 检测 精度 均 得 到 较 好 的 提高 。 为 了 更 加 直观 
地 表示 模型 的 预测 能 力 ， 图 7 为 3 种 模型 在 最 优 样 


本 数量 下 的 菌 草 MDA 含量 预测 值 与 实测 值 相关 图 。 
结果 表明 ， 利 用 DCGAN 模 型 对 原始 建 模 集 进行 数 
据 扩 充 可 以 获得 更 好 的 精度 与 稳定 性 。 同 时 ， 充 足 
的 数据 集 有 助 于 得 到 最 优 的 检测 结果 。 


0.54 , " 1 1 1 L " i 
0 48 96 144 192 240 288 336 384 
生成 样本 数量 
(a) 生 成 样本 数量 与 RR 曲线 图 
59 一 一 PLSR 
— RF 
3.5L MES ONM 
ul 
e S 
isa] A. u 
N 3 X 
230 A 
E 


1 n 1 à " n " 2 " 
0 48 96 144 192 240 288 336 384 
生成 样本 数量 


(b) 生 成 样本 数量 与 RMSEP 曲线 图 
图 6 添加 不 同 生 成 样本 数量 的 3 种 检测 模型 的 RR 与 RMSEP 
曲线 图 
Fig. 6 R^ and RMSEP curves of three detection models with dif- 


ferent generated sample sizes added 


4 结论 


«d 


本 研究 以 低温 胁迫 下 的 6 种 菌 草 植株 为 研究 对 


一 一 一 趋势 线 ”一 -一 一 95% 置信 区 间 曲 线 95% 预测 区 间 曲 线 

一 40 = 40 = 40 
oo $9 | PLSR $5 |CNN 
s 35 S35 o 35 
É E E 
c £e Ez] 
= 30 = 30 = 30 
x i m 
E 25 E25 = 25 
wis] 20 IE 20 UR 20 
如 qa «t 
qa 5 Ais Aus 
= 三 = 

10 n : 10 10 

10 15 20 25 30 35 40 10 15 20 25 30 35 40 10 15 20 25 30 35 40 
MDA 含 量 实际 值 /(nmol'g !) MDA 含 量 实际 值 (nmol'g !) MDA 215 Sc Eo fi /(nmol-g !) 
(a) RF 模型 (b) PLSR 模型 (c) CNN 模型 


图 7 不 同 模型 下 菌 草 MDA 含 量 预测 值 与 实测 值 相关 图 


Fig. 7 Correlation graph of predicted and measured MDA content of JUNCAO under different models 
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表 3 建立 不 同 模型 的 菌 草 MDA 含 量 最 优 检测 效果 
Table 3 Establishing different models for the optimal detection 
of MDA content in JUNCAO 


模型 ”添加 样 训练 集 预测 集 

选择 本 数量 R? RMSEC  R/ RMSEP RPD 

PLSR 134 0.8376 1.8781 0.7566 2.5263 2.0269 
RF . 248 0.8716 1.9817 0.7922 2.4063 2.1937 

CNN 192 0.7512 2.7107 0.7484 2.6298 1.9936 


象 ， 提 出 了 一 维 DCGAN 模型 用 于 拓展 样本 数量 ， 
并 结合 PLSR、REF 以 及 CNN 模 型 对 菌 草 MDA 含量 
进行 定量 检测 。 研 究 表明 : CD) 低温 胁迫 后 ， 菌 草 
叶片 的 MDA 含量 相 较 于 对 照 组 会 显著 升 高 ， 其 可 
见 / 近 红 外 光谱 反射 率 较 于 对 照 组 也 呈现 增 大 趋势 ; 
(2) DCGAN 模型 能 用 于 扩充 样本 数量 ， 并 且 随 着 
添加 样本 数量 的 增多 ， 模 型 精度 会 呈现 先 升 高 后 减 
小 的 趋势 ; (3) 三 种 模型 在 数据 扩充 后 的 评价 指标 
皆 优 于 原始 数据 集 ， 采 用 DCGAN 联合 RF 模型 可 
以 获得 最 佳 的 MDA 含量 检测 效果 。 

本 研究 可 用 于 低温 胁迫 下 小 样本 量 菌 草 MDA 
含量 的 快速 检测 ， 可 为 菌 草 育种 及 低温 胁迫 诊断 提 
共 一 定 的 理论 依据 和 技术 支持 。 


利益 冲突 声明 : 本 研究 不 存在 研究 者 以 及 与 公开 
研究 成 果 有 关 的 利益 冲突 。 
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Abstract: 


[Objective] JUNCAO, a perennial herbaceous plant that can be used as medium for cultivating edible and medicinal fungi. It has im- 
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portant value for promotion, but the problem of overwintering needs to be overcome when planting in the temperate zone. Low-tem- 
perature stress can adversely impact the growth of JUNCAO plants. Malondialdehyde (MDA) is a degradation product of polyunsatu- 
rated fatty acid peroxides, which can serve as a useful diagnostic indicator for studying plant growth dynamics. Because the more se- 
vere the damage caused by low temperature stress on plants, the higher their MDA content. Therefore, the detection of MDA content 
can provide instruct for low-temperature stress diagnosis and JUNCAO plants breeding. With the development of optical sensors and 
machine learning technologies, visible/near-infrared spectroscopy technology combined with algorithmic models has great potential in 
rapid, non-destructive and high-throughput inversion of MDA content and evaluation of JUNCAO growth dynamics. 

[Methods] In this research, six varieties of JUNCAO plants were selected as experimental subjects. They were divided into a control 
group planted at ambient temperature (28°C) and a stress group planted at low temperature (4? C). The hyperspectral reflectances of 
JUNCAO seedling leaves during the seedling stage were collected using an ASD spectroradiomete and a near-infrared spectrometer, 
and then the leaf physiological indicators were measured to obtain leaf MDA content. Machine learning methods were used to estab- 
lish the MDA content inversion models based on the collected spectral reflectance data. To enhance the prediction accuracy of the 
model, an improved one-dimensional deep convolutional generative adversarial network (DCAGN ) was proposed to increase the sam- 
ple size of the training set. Firstly, the original samples were divided into a training set (96 samples) and a prediction set (48 samples) 
using the Kennard stone (KS) algorithm at a ratio of 2:1. Secondly, the 96 training set samples were generated through the DCGAN 
model, resulting in a total of 384 pseudo samples that were 4 times larger than the training set. The pseudo samples were randomly 
shuffled and sequentially added to the training set to form an enhanced modeling set. Finally, the MDA quantitative detection models 
were established based on random forest (RF), partial least squares regression (PLSR), and convolutional neural network (CNN) algo- 
rithms. By comparing the prediction accuracies of the three models after increasing the sample size of the training set, the best MDA 
regression detection model of JUNCAO was obtained. 

[Results and Discussions] (1) The MDA content of the six varieties of JUNCAO plants ranged from 12.1988 to 36.7918 nmol/g. No- 
tably, the MDA content of JUNCAO under low-temperature stress was remarkably increased compared to the control group with sig- 
nificant differences (P«0.05). Moreover, the visible/near-infrared spectral reflectance in the stressed group also exhibited an increasing 
trend compared to the control group. (2) Samples generated by the DCAGN model conformed to the distribution patterns of the origi- 
nal samples. The spectral curves of the generated samples retained the shape and trends of the original data. The corresponding MDA 
contented of generated samples consistently falling within the range of the original samples, with the average and standard deviation 
only decreased by 0.6650 and 0.9743 nmol/g, respectively. (3) Prior to the inclusion of generated samples, the detection performance 
of the three models differed significantly, with a correlation coefficient (R°) of 0.6967 for RF model, that of 0.6729 for CNN model, 
and that of 0.5298 for the PLSR model. After the introduction of generated samples, as the number of samples increased, all three 
models exhibited an initial increase followed by a decrease in R° on the prediction set, while the root mean square error of prediction 
(RMSEP) first decreased and then increased. (4) The prediction results of the three regression models indicated that augmenting the 
sample size by using DCGAN could effectively enhance the prediction performance of models. Particularly, utilizing DCGAN in com- 
bination with the RF model achieved the optimal MDA content detection performance, with the R? of 0.7922 and the RMSEP of 
2.1937. 

[Conclusions| Under low temperature stress, the MDA content and spectral reflectance of the six varieties of JUNCAO leaves signifi- 
cantly increased compared to the control group, which might due to the damage of leaf pigments and tissue structure, and the decrease 
in leaf water content. Augmenting the sample size using DCGAN effectively enhanced the reliability and detection accuracy of the 
models. This improvement was evident across different regression models, illustrating the robust generalization capabilities of this DC- 
GAN deep learning network. Specifically, the combination of DCGAN and RF model achieved optimal MDA content detection perfor- 
mance, as expanding to a sufficient sample dataset contributed to improve the modeling accuracy and stability. This research provides 
valuable insights for JUNCAO plants breeding and the diagnosis of low-temperature stress based on spectral technology and machine 


learning methods, offering a scientific basis for achieving high, stable, and efficient utilization of JUNCAO plants. 
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